Міністерство освіти та науки України
Національний університет „Львівська політехніка”
Кафедра САПР
Звіт
до лабораторної роботи № 2
з курсу: «Комп’ютерна лінгвістика»
на тему:
« Основи програмування на мові Рython»
Виконав: ст. гр. ПРЛ-1
Львів -2008
Мета роботи: вивчення основ програмування на мові Python, ознайомлення із регулярними виразами.
ТЕОРЕТИЧНІ ВІДОМОСТІ
Python - це проста і потужна об’єктно-орієнтована мова програмування високого рівня з чудовими можливостями для обробки лінгвістичних даних.
Засоби керування логікою
Програми, які згадувалися в лабораторній роботі №1, доволі прості, але дозволяють здійснювати операції над послідовностями слів і зокрема над кожним із них. Ми працювали зі списками, які містять декілька слів , але є потреба працювати з такими списками, які містять тисячі слів . Це зумовлює необхідність мати засоби, які керують поведінкою програм.
Засоби здійснення простого керування
Більшість мов програмування дозволяють виконання окремих блоків програми, коли використовуються умовні вирази або if твердження. В наступній програмі ми створили змінну word, яка містить значення ‘cat’ типу стрічка. If- вираз перевіряє умову чи довжина слова <5, чи ні. Якщо умова виразу справджується, то виконується тіло if твердження і виконується оператор print .
If твердження, так як і For твердження - це керуючі (управляючі) структури, які керують виконанням програми. Вони вибирають, яка частина коду в тілі програми буде виконуватися. Стрічка з операторами If та For повинна завершуватися двокрапкою. Якщо потрібно, щоб щось відбувалося, коли умовний вираз не справджується, використовується оператор else в If – твердженні.
Умовні вирази
Python підтримує широкий набір операторів для встановлення взаємозв’язків між змінними (значеннями).
Цілі, стрічки і списки є типами даних в Python. Кожне значення (змінна) має свій тип. Цей тип визначає, які операції ви можете виконувати зі змінною. Наприклад, ми можемо індексувати стрічки і списки, але не можемо індексувати цілі.
Ітерації і If твердження
Нехай маємо стрічку і необхідно написати програму, яка виведе на екран всі слова, які мають закінчення «ow». Програма буде складатися з наступних частин. Спочатку розділимо стрічку на список слів.
Організація даних
Стрічки і списки - простий метод організації даних. Звичайно, вони відображають відповідність між значеннями і цілими. Можна переглянути стрічку використовуючи індекси символів і отримати окремі символи. Також можна переглядати списки слів використовуючи цілі значення і отримуючи одну із стрічок .
Організація доступу між даними
Python підтримує такий тип даних, як словник, і він використовується для встановлення відповідності (відображення) між довільними типами даних. Визначимо pos як пустий словник і додамо до нього значення, які встановлюють частиномовну приналежність певних слів . Значення додаються із використанням квадратних дужок.
Отримання унікальних записів
Розглянемо приклад. Нехай необхідно створити словник на основі документу. Таким словником буде відсортований список слів, що зустрічаються без врахування їх повторюваності. У цьому випадку потрібно провести не обчислення, а запис даних, які аналізуються незалежно від їх повторюваності. Цього можна досягнути двома шляхами. Перший – використовуючи списки. Аналогічний результат можна отримати, використавши словники. Кожне слово, яке зустрічається, записуємо в словник, як ключ. Всі значення ставимо рівними 1 або інше. Третій шлях здійснити те саме, найкращий зі всіх: використовуючи тип даних властивий Python set()(набір). Можна конвертувати речення(тип даних список) в набір, використовуючи set(sentence) .
Визначення функції
При програмуванні часто необхідно частину програми виконати (використати) декілька разів. Наприклад, потрібно написати програму, яка здійснює утворення множини з однини іменників і вона буде виконуватись в різних місцях програми. Швидше ніж повторювати той самий код декілька разів і більш...